【知识学习】fine-tuning

fine-tuning是指模型微调,即采用已经训练好的普适模型,去应用到相应的场景上继续更新。

其原理实质是假设参数服从一个已知的分布,通过普适模型会有一个先验值,即告诉你参数取值范围在该先验值左右,然后你再通过具体的数据去不断拟合真实场景的情况。

其应用的前提是普适模型对应的数据集是在同一个空间上的,应用比较广泛的可能是图像处理(CNN)上,由于CNN浅层的目标只是去拟合些基础的特征,轮廓、边缘信息,而这些信息在图像集上是存在共性的,并且往往普适数据集一般是比较全面、通用的数据集。

个人理解,为了提取信息是普适可用的,模型一般迭代次数、层次建构往往是越简单越ok

fine-tunning的提出,主要是为了解决以下几个问题:

  1. 再训练的数据集比较小,训练模型容易过拟合,故构建一个合理假设前提防止其跑偏
  2. 再训练的模型从头训练,一方面由于起点位置容易局部最优,另一方面需要重复迭代消耗计算时间和资源

fine-tunning的使用前提:

  1. 数据集相似

区别下fine-tunning和迁移学习。fine-tuning的理论提出是为了解决小数据集的限制问题,其往往是由宏观到微观的细化;而迁移学习的本质是利用相同数据集(数据切割或者抽样)的历史信息来迭代适应现在的数据,是由陈推新或者部分推整体的思路。

fine-tuning是一种精细化训练模型的手段,而迁移学习是一种学习的框架体系

results matching ""

    No results matching ""